期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于多信息感知的多方对话问答方法
高晓倩, 周夏冰, 张民
北京大学学报自然科学版    2023, 59 (1): 21-29.   DOI: 10.13209/j.0479-8023.2022.069
摘要464)   HTML    PDF(pc) (750KB)(121)    收藏
目前基于多方对话文本的自动问答任务侧重于探索对话结构信息或说话者角色信息, 忽视问题文本和对话文本的交互。针对这一问题, 提出一个融合多信息的全新模型。该模型使用图卷积神经网络, 对多方对话文本中的话语结构、说话者角色以及问题–上下文信息进行分层次建模, 并设计合理的基于注意力机制的交互层, 通过选择更有帮助的信息, 加强对多方对话文本的理解。此外, 该模型首次对问题和上下文间的显式交互给予关注。实验结果表明, 所提模型的性能优于多个基线模型, 实现对多方对话文本的深层次理解。
相关文章 | 多维度评价 | 评论0
2. 面向问答领域的数据增强方法
丁家杰, 肖康, 叶恒, 周夏冰, 张民
北京大学学报自然科学版    2022, 58 (1): 54-60.   DOI: 10.13209/j.0479-8023.2021.112
摘要648)   HTML    PDF(pc) (398KB)(162)    收藏
针对当前自动问答数据增强方法需要大量外部数据的问题, 提出一个面向问答模型缺陷的数据增强方法。首先, 在训练集上训练好问答模型、问题生成模型以及问答匹配模型; 然后, 获取问答模型在训练集上预测的所有答案, 并选取其中预测错误的答案; 再后, 使用问题生成模型对这些答案生成相应问题; 最后, 通过问答匹配模型对生成的问答对进行过滤, 保留其中质量较高的数据作为最终的增强数据。该方法不需要额外的数据与领域知识, 同时能够针对模型构造特定数据, 耗费较少的训练代价就能使模型性能提升。实验结果表明, 所提出的数据增强方法对R-Net, Bert-Base以及Luke均有效, 与其他数据增强方法相比, 在较少的增强数据规模下, 问答模型获得更好的性能提升。
相关文章 | 多维度评价 | 评论0
3. 基于神经耦合模型的异构词法数据转化和融合
黄德朋, 李正华, 龚晨, 张民
北京大学学报自然科学版    2020, 56 (1): 97-104.   DOI: 10.13209/j.0479-8023.2019.098
摘要800)   HTML    PDF(pc) (673KB)(119)    收藏
为了扩大人工标注数据的规模, 从而提高模型性能, 尝试充分利用已有的异构人工标注数据训练模型参数。将Li等2015年提出的耦合序列标注方法扩展到基于BiLSTM的深度学习框架, 直接在两个异构训练数据上训练参数, 测试阶段则同时预测两个标签序列。在词性标注、分词词性联合标注两个任务上进行大量实验, 结果表明, 与多任务学习方法和传统耦合模型相比, 神经耦合模型在利用词法异构数据方面更优越,在异构数据转化和融合两个场景上都取得更高的性能。
相关文章 | 多维度评价 | 评论0
4. 句法增强的UCCA语义分析方法
蒋炜, 李正华, 张民
北京大学学报自然科学版    2020, 56 (1): 89-96.   DOI: 10.13209/j.0479-8023.2019.099
摘要1147)   HTML    PDF(pc) (644KB)(126)    收藏
考虑到句法结构与语义结构之间的紧密联系, 尝试将句法信息融入UCCA语义分析模型中来增强语义分析的性能。基于目前性能最好的基于图的 UCCA语义分析模型, 提出并比较4种不同的融入依存句法信息的方法。采用SemEval-2019国际评测语义分析任务的英文数据集进行实验, 在本领域和跨领域两个数据集上的结果均表明, 句法增强的方法能够给显著地提高UCCA分析性能。引入BERT特征后, 句法信息仍然可以提供一定的帮助。
相关文章 | 多维度评价 | 评论0
5. 基于词模式嵌入的词语上下位关系分类
孙佳伟, 李正华, 陈文亮, 张民
北京大学学报自然科学版    2019, 55 (1): 1-7.   DOI: 10.13209/j.0479-8023.2018.055
摘要1347)   HTML    PDF(pc) (4709KB)(315)    收藏

提出一种基于词模式的上下位关系分类方法, 可以有效地缓解传统的基于模式的分类方法存在的稀疏问题, 提高了关系分类的召回率。进一步地, 通过词模式嵌入, 将基于模式的方法与基于词嵌入的方法进行有效的融合。为了验证方法的有效性, 标注一个包含12000个汉语词语对的数据集。实验结果表明, 该词模式嵌入方法是有效的, F1值可以达到95.36%。

相关文章 | 多维度评价 | 评论0
6. 基于双语合成语义的翻译相似度模型
王超超,熊德意,张民
北京大学学报(自然科学版)   
摘要760)      PDF(pc) (511KB)(384)    收藏
提出基于双语合成语义的翻译相似度模型, 通过在翻译过程中引入双语语义相似度特征提高翻译性能。首先利用分布式方法分别在源端和目标端获取短语的单语合成语义向量, 然后利用神经网络将它们映射到同一语义空间, 获得双语合成语义向量。在该语义空间, 计算源语言短语和对应的目标语言短语之间基于合成语义向量的翻译相似度, 将其作为一个新特征加入解码器。在汉英翻译NIST06和NIST08测试数据集上, 相较于基准系统, 基于双语合成语义的翻译相似度模型获得0.56和0.42 BLEU值的显著性提高。
相关文章 | 多维度评价 | 评论0